日本国特許庁 1/9/ JAPAN PATENT OFFICE 9678

別紙添付の書類に記載されている事項は下記の出願書類に記載されている事項と同一であることを証明する。

This is to certify that the annexed is a true copy of the following application as filed with this Office

出願年月日

Date of Application:

2001年 1月10日

出 願 番 号

Application Number:

特願2001-002141

出 願 人
Applicant(s):

日本電気株式会社

2001年10月19日

特 許 庁 長 官 Commissioner, Japan Patent Office





# 特2001-002141

【書類名】

特許願

【整理番号】

66206349

【提出日】

平成13年 1月10日

【あて先】

特許庁長官殿

【国際特許分類】

G06F 9/38

【発明者】

【住所又は居所】

東京都港区芝五丁目7番1号 日本電気株式会社内

【氏名】

深川雅夫

【特許出願人】

【識別番号】

000004237

【氏名又は名称】

日本電気株式会社

【代理人】

【識別番号】

100088959

【弁理士】

【氏名又は名称】

境 廣巳

【手数料の表示】

【予納台帳番号】

009715

【納付金額】

21,000円

【提出物件の目録】

【物件名】

明細書 1

【物件名】

図面 1

【物件名】

要約書 1

【包括委任状番号】 9002136

【プルーフの要否】

要

【書類名】 明細書

【発明の名称】 リオーダバッファの管理方法及びプロセッサ

【特許請求の範囲】

【請求項1】 分岐予測によりプログラムの流れを予測し、プログラム中の命令列から次に実行可能な命令を探し出し、予測と命令の依存関係に基づいて命令を投機的に実行するout-of-order実行プロセッサであって、実行結果の書き戻しをプログラムの順番にするためのリオーダバッファを有し、前記リオーダバッファのエントリ番号であるWRB番号を用いて演算ユニット、分岐ユニット及びロードユニット等の各機能ユニットから命令の終了を前記リオーダバッファに通知するようにしたプロセッサにおけるリオーダバッファの管理方式において、

前記ロードユニットに、自ユニットに対して発行されたロード命令の最新の投機状態を前記分岐ユニットから出力される分岐予測成功/失敗信号に基づいて管理し、分岐予測が失敗した分岐命令の後続のロード命令についてはその処理が終了しても当該ロード命令のWRB番号による前記リオーダバッファへの通知を抑止する管理手段を設け、

前記リオーダバッファは、分岐予測が失敗した分岐命令の後続命令を格納して あるエントリを該エントリのWRB番号による終了通知を待たずに新たな命令の 格納に再利用することを特徴とするリオーダバッファの管理方法。

【請求項2】 非投機実行/投機実行を各命令毎に区別するための制御信号であって、当該命令が非投機実行にかかる命令の場合には0、投機実行にかかる命令の場合には非投機実行の命令から当該命令までの間に介在する分岐命令の数によって決まる1以上の値とされる分岐レベルを命令フェッチ/デコードユニットで生成して、前記リオーダバッファ及び前記ロードユニットの前記管理手段で保持し、前記リオーダバッファ及び前記管理手段において、前記分岐ユニットから分岐予測失敗信号が出力される毎に分岐レベルを-1することにより、命令の最新の投機状態を管理するようにした請求項1記載のリオーダバッファの管理方法。

【請求項3】 前記管理手段は、自ユニットに対して発行されたロード命令

をその分岐レベル及びWRB番号とともに保持するエントリを複数有し、前記分岐ユニットから分岐予測失敗信号が出力されたとき、分岐レベルが1以上のエントリをキャンセル状態とし、該キャンセル状態としたエントリに保持されたロード命令についてはその処理が終了しても当該ロード命令のWRB番号による前記リオーダバッファへの通知を抑止する請求項2記載のリオーダバッファの管理方法。

【請求項4】 分岐予測によりプログラムの流れを予測し、プログラム中の命令列から次に実行可能な命令を探し出し、予測と命令の依存関係に基づいて命令を投機的に実行するout-of-order実行プロセッサであって、実行結果の書き戻しをプログラムの順番にするためのリオーダバッファを有し、前記リオーダバッファのエントリ番号であるWRB番号を用いて演算ユニット、分岐ユニット及びロードユニット等の各機能ユニットから命令の終了を前記リオーダバッファに通知するようにしたプロセッサにおいて、

前記ロードユニットに、自ユニットに対して発行されたロード命令の最新の投機状態を前記分岐ユニットから出力される分岐予測成功/失敗信号に基づいて管理し、分岐予測が失敗した分岐命令の後続のロード命令についてはその処理が終了しても当該ロード命令のWRB番号による前記リオーダバッファへの通知を抑止する管理手段を設け、

前記リオーダバッファは、分岐予測が失敗した分岐命令の後続命令を格納して あるエントリを該エントリのWRB番号による終了通知を待たずに新たな命令の 格納に再利用することを特徴とするプロセッサ。

【請求項5】 非投機実行/投機実行を各命令毎に区別するための制御信号であって、当該命令が非投機実行にかかる命令の場合には0、投機実行にかかる命令の場合には非投機実行の命令から当該命令までの間に介在する分岐命令の数によって決まる1以上の値とされる分岐レベルを命令フェッチ/デコードユニットで生成して、前記リオーダバッファ及び前記ロードユニットの前記管理手段で保持し、前記リオーダバッファ及び前記管理手段において、前記分岐ユニットから分岐予測失敗信号が出力される毎に分岐レベルを-1することにより、命令の最新の投機状態を管理するように構成した請求項4記載のプロセッサ。

【請求項6】 前記管理手段は、自ユニットに対して発行されたロード命令をその分岐レベル及びWRB番号とともに保持するエントリを複数有し、前記分岐ユニットから分岐予測失敗信号が出力されたとき、分岐レベルが1以上のエントリをキャンセル状態とし、該キャンセル状態としたエントリに保持されたロード命令についてはその処理が終了しても当該ロード命令のWRB番号による前記リオーダバッファへの通知を抑止する構成を有する請求項5記載のプロセッサ。

## 【発明の詳細な説明】

[0001]

## 【発明の属する技術分野】

本発明は、リオーダバッファ等を使用してout-of-order実行を行うプロセッサに関し、特にリオーダバッファを効率良く使用することができるリオーダバッファの管理方法に関する。

[0002]

## 【従来の技術】

プログラム中の命令の順番を飛び越して、命令を並列実行する方式をout-of-order実行と言い、in-order実行に比べて実効的な並列度を高くすることができる。このため、高性能なプロセッサには今や必須の技術となっている。

[0003]

out-of-order実行プロセッサでは、逆依存、出力依存といったデータ依存関係を検出し、それらを解決してout-of-order実行を行う。逆依存は後続命令のデスティネーションレジスタが先行命令のソースレジスタに一致する場合に起こり、出力依存は後続命令と先行命令とでデスティネーションレジスタが一致する場合に起こる。これらは、後続命令の実行結果を一時レジスタに保持しておき、本来のレジスタへはプログラム順に従って書き込むことにより解決される。また、後続命令の実行結果を利用する命令は、本来のレジスタに格納される以前でも、一時レジスタからデータを読み出して実行を開始できる。これをレジスタリネーミングと呼び、それに使う一時レジスタをリネーミングレジスタ(Renaming Register)と言う。

[0004]

また、out-of-order実行プロセッサにおいて、飛び越された命令など、実行開始(発行)待ちの命令を保持しておくバッファをリザベーションステーションと呼び、実行結果の書き戻しをプログラムの順番にするためのバッファをリオーダバッファと呼ぶ。このバッファのサイズが大きいほど、out-of-order実行できる命令列の範囲を広くできる。また、制御依存に対しては、分岐先を予測して投機的に命令実行を行うことにより、並列実行を可能にしている。投機実行のキャンセル及び例外発生時の処理は、一般にリオーダバッファの機能として実現されている。

[0005]

## 【発明が解決しようとする課題】

前述したようにoutーofーorder実行できる命令列の範囲を広げる為には、サイズの大きなリオーダバッファが必要になるが、サイズの上限にはテクノロジによる限界があるため、限られたサイズのリオーダバッファを如何に効率良く使用するかが大切である。しかし、従来は、分岐予測失敗によりリオーダバッファ内の投機命令列をキャンセルしても、そのキャンセルした投機命令列で使用されていたエントリのうち、未完了のロード命令で使用していたエントリは後続命令で直ちに使用することができないという課題があった。

[0006]

この従来の課題を本発明の実施の形態を示す図1を借用して以下説明する。リオーダバッファ6には未完了命令を保持するエントリ61が多数設けられており、各エントリ61には物理的な番号が付与され、一意に識別できるようになっている。このエントリ61に付与された番号をWRB番号と言う。各エントリ61には、命令フェッチ/デコードユニット1でデコードされた命令のオペコードやレジスタ情報などを含む命令情報63が登録されるが、各エントリ61に登録された命令の実行が終了したか否かを示すビット65も登録される。このビットをDONEビットと呼ぶ。DONEビット65は、当該命令が終了した時点で点灯される。

[0007]

# 特2001-002141

ここで、ロード命令の場合、ロードユニット5内の図示しないデータキャッシュでキャッシュミスすると、ロードユニット5から図示しない主記憶にロードリクエストを送出し、そのリプライが返ってきた時点で、当該ロード命令が格納されているリオーダバッファ6のエントリ61のWRB番号をリオーダバッファ6に送出し、当該ロード命令のエントリ61のDONEビット65を点灯させる。一般にロード命令のレイテンシは大きいため、DONEビット65が点灯するまでには比較的長い時間がかかる。この動作は、当該ロード命令が非投機実行か、投機実行かにかかわらず、また当該ロード命令が主記憶にロードリクエストを送出した後にキャンセルされたか否かにかかわらず、一律に実施している。

[0008]

その為、分岐ユニット2で分岐予測が失敗したことが判明し、リオーダバッファ6で当該分岐命令の後続命令列をすべてキャンセルしても、キャンセルした後続命令列に未完了のロード命令が存在していた場合、ロードユニット5から後刻に当該ロード命令のWRB番号が通知されてくる。従って、若しキャンセルしたエントリ61を別の新たな命令で再利用していると、この新たな別の命令のDONEビットを誤って点灯させてしまう事態を招く。そのため、従来は、キャンセルした後続命令列のうち未完了のロード命令が使用していたエントリについては、そのエントリのWRB番号が通知されてくるまで再利用しないようにしており、それがリオーダバッファ6の使用効率を低下させる原因となっていた。

[0009]

本発明はこのような事情に鑑みて提案されたものであり、その目的は、リオー ダバッファの使用効率を向上させることにある。

[0010]

#### 【課題を解決するための手段】

本発明は上記の目的を達成するために、分岐予測によりプログラムの流れを予測し、プログラム中の命令列から次に実行可能な命令を探し出し、予測と命令の依存関係に基づいて命令を投機的に実行するoutーofーorder実行プロセッサであって、実行結果の書き戻しをプログラムの順番にするためのリオーダバッファを有し、前記リオーダバッファのエントリ番号であるWRB番号を用い

# 特2001-002141

て演算ユニット、分岐ユニット及びロードユニット等の各機能ユニットから命令の終了を前記リオーダバッファに通知するようにしたプロセッサにおいて、前記ロードユニットに、自ユニットに対して発行されたロード命令の最新の投機状態を前記分岐ユニットから出力される分岐予測成功/失敗信号に基づいて管理し、分岐予測が失敗した分岐命令の後続のロード命令についてはその処理が終了しても当該ロード命令のWRB番号による前記リオーダバッファへの通知を抑止する管理手段を設け、前記リオーダバッファは、分岐予測が失敗した分岐命令の後続命令を格納してあるエントリを該エントリのWRB番号による終了通知を待たずに新たな命令の格納に再利用することを特徴とする。

## [0011]

また、本発明は、非投機実行/投機実行を各命令毎に区別するための制御信号であって、当該命令が非投機実行にかかる命令の場合には 0、投機実行にかかる命令の場合には非投機実行の命令から当該命令までの間に介在する分岐命令の数によって決まる 1以上の値とされる分岐レベルを命令フェッチ/デコードユニットで生成して、前記リオーダバッファ及び前記ロードユニットの前記管理手段で保持し、前記リオーダバッファ及び前記管理手段において、前記分岐ユニットから分岐予測失敗信号が出力される毎に分岐レベルを - 1 することにより、命令の最新の投機状態を管理するようにしている。

## [0012]

更に、前記管理手段は、自ユニットに対して発行されたロード命令をその分岐 レベル及びWRB番号とともに保持するエントリを複数有し、前記分岐ユニット から分岐予測失敗信号が出力されたとき、分岐レベルが1以上のエントリをキャ ンセル状態とし、該キャンセル状態としたエントリに保持されたロード命令につ いてはその処理が終了しても当該ロード命令のWRB番号による前記リオーダバ ッファへの通知を抑止するようにしている。

## [0013]

#### 【作用】

本発明にあっては、ロードユニットにおいて、自ユニットに対して発行されたロード命令の最新の投機状態を分岐ユニットから出力される分岐予測成功/失敗

信号に基づいて管理し、分岐予測が失敗した分岐命令の後続のロード命令についてはその処理が終了しても当該ロード命令のWRB番号によるリオーダバッファへの通知を抑止したことにより、キャンセルした後続命令列に未完了のロード命令が存在していても、ロードユニットから後刻に当該ロード命令のWRB番号が通知されてくることはなくなる。このため、リオーダバッファのキャンセルしたエントリを別の新たな命令で再利用しても、この新たな別の命令のDONEビットが誤って点灯されることがなく、分岐予測が失敗した分岐命令の後続命令を格納してあるリオーダバッファのエントリを該エントリのWRB番号による終了通知を待たずに新たな命令の格納に速やかに再利用することができる。

[0014]

## 【発明の実施の形態】

次に本発明の実施の形態の例について図面を参照して詳細に説明する。

#### [0015]

図1は本発明を適用したプロセッサの概略構成を示すブロック図である。この例のプロセッサは、分岐予測によりプログラムの流れを予測し、プログラム中の命令列から次に実行可能な命令を探し出し、予測と命令の依存関係に基づいて命令を投機的に実行するout-of-order実行プロセッサであり、命令フェッチ/デコードユニット1と、幾つかの機能ユニット、即ち分岐ユニット2、演算ユニット3、ストアユニット4及びロードユニット5と、確定ユニット7と、各機能ユニットの前段に設けられたリザベーションステーション8とを主要部として備えている。また、確定ユニット7は、複数のエントリ61を有するリオーダバッファ6を有する。さらに、ロードユニット5は、発行されたロード命令を保持管理する複数のエントリ52を有する管理部51を備えている。

#### [0016]

図1の例では、ストアユニット4とロードユニット5とを別ユニットとしているが同一のユニット(ロード/ストアユニット)で構成しても良い。また、各機能ユニットに共通な1つのリザベーションステーション8を設けてあるが、各機能ユニット毎に異なるリザベーションステーションを設けても良いし、幾つかの機能ユニットのグループ毎に共通な1つのリザベーションステーションを設けて

も良い。

[0017]

命令フェッチ/デコードユニット1は、命令キャッシュから命令をフェッチしてデコードするユニットであり、命令の依存関係を解消するためのレジスタリネーミング処理や分岐予測により予測された分岐方向への投機的実行を制御する。命令の依存関係の調査のためにリオーダバッファ6に既に格納されている先行命令を参照する。また、リオーダバッファ6の次に使用する空きのエントリ61を指すポインタも管理しており、その空きのエントリ61に、命令のオペコードやレジスタ情報等の命令情報63及びその命令の分岐レベル64等を登録する。分岐レベル64は、非投機実行/投機実行を各命令毎に区別するための制御信号であって、当該命令が非投機実行にかかる命令の場合には0、投機実行にかかる命令の場合には非投機実行の命令から当該命令までの間に介在する分岐命令の数によって決まる1以上の値とされる。リオーダバッファ6のエントリ61には、当該エントリが使用中か否かを示すVビット62、当該エントリの命令の実行が終了したか否かを示すDONEビット65も設けられており、命令の登録時は、Vビット62を"1"に点灯させて使用中、DONEビット65を"0"に消灯して未終了とする。

[0018]

更に命令フェッチ/デコードユニット1は、各命令のデコード結果をその命令の分岐レベル及びその命令を登録したリオーダバッファ6のエントリ61のWR B番号と一緒にリザベーションステーション8に登録する。リザベーションステーション8は、登録された命令のオペランドと対応する機能ユニットが全て利用可能になると、分岐ユニット2、演算ユニット3、ストアユニット4及びロードユニット5のうちの該当する機能ユニットに命令を発行する。この際、発行する命令には分岐レベル及びWRB番号が付随する。

[0019]

分岐ユニット2は、発行された分岐命令を実行し、当該分岐命令に付随するW RB番号を指定した分岐予測成功/失敗信号を命令フェッチ/デコードユニット 1、リザベーションステーション8、リオーダバッファ7及びロードユニット5

## 特2001-002141

に出力する。命令フェッチ/デコードユニット1では、この分岐予測成功/失敗信号に基づいて分岐履歴を更新する。リザベーションステーション8では、分岐予測成功時は保持している各命令の分岐レベルを-1し、分岐予測失敗時は分岐レベル1以上の命令を全てキャンセルする。リオーダバッファ6では、分岐予測成功時はエントリ61に保持している各命令の分岐レベル64を-1し、分岐予測失敗時は分岐レベル1以上の命令を全てキャンセルし、キャンセルした命令を保持していたエントリ61のVビット62を"0"にして再利用を可能にする。分岐予測成功/失敗信号を受信したロードユニット5の処理については後述する

## [0020]

演算ユニット3は、発行された演算命令を実行し、その終了時に当該演算命令に付随するWRB番号を指定してリオーダバッファ6に終了通知を送る。リオーダバッファ6は、指定されたWRB番号のエントリ61のDONEビット65を命令終了を示す"1"に点灯する。

## [0021]

ストアユニット4は、発行されたストア命令に従って主記憶に対してストアリクエストを送出し、その終了時に当該ストア命令に付随するWRB番号を指定してリオーダバッファ6に終了通知を送る。リオーダバッファ6は、指定されたWRB番号のエントリ61のDONEビット65を命令終了を示す"1"に点灯する。

#### [0022]

ロードユニット5は、自ユニット5に対して発行されたロード命令53をそれに付随する分岐レベル54及びWRB番号55とともに保持するエントリ52を複数有する管理部51を備えている。管理部51は、分岐ユニット2から分岐予測成功/失敗信号を受けると、分岐予測成功時にはエントリ52に保持されたロード命令の分岐レベル54を-1することで、各ロード命令の最新の投機状態を管理する。また、分岐予測失敗時には、分岐レベル54が1以上のエントリ52をキャンセル状態とする。管理部51の各エントリ52に登録されたロード命令はその発行順に処理され、図示しないデータキャッシュからのキャッシュデータ

の送出、ミスヒットした場合の主記憶へのロードリクエストの送出とそのリプライデータのデータキャッシュへの書き込み等の処理を実行する。そして、ロード命令の実行終了時、当該ロード命令を格納するエントリ52がキャンセル状態でなければ、そのエントリ52に格納されたWRB番号55を指定してリオーダバッファ6に終了通知を送る。リオーダバッファ6は、指定されたWRB番号のエントリ61のDONEビット65を命令終了を示す"1"に点灯する。他方、実行終了したロード命令を格納するエントリ52がキャンセル状態であれば、WRB番号55によるリオーダバッファ6への終了通知を抑止する。

[0023]

確定ユニット7は、未完了命令をすべてリオーダバッファ6のエントリ61に 記録し、各機能ユニット2~5からWRB番号を指定した終了通知を受けること により該当するエントリ61のDONEビット65を"1"に点灯させることで 各命令の実行終了の有無を管理する。確定ユニット7は、該当する機能ユニット での命令操作が完了してDONEビット65が点灯しており、その命令と関係す る分岐が確定しており、且つ、先に発行された命令が全て確定している命令につ いて、その命令の実行結果をソフトウェアビジブルなレジスタに書き込む等の措 置を実施する。また、分岐予測が外れた場合には、当該分岐の後続命令の結果を すべて無効とし、現時点における投機状態の命令の全てをリオーダバッファ6か らキャンセルする。現時点における投機命令がどの命令であるかを管理するため に、確定ユニット7は、分岐ユニット2から分岐予測成功が通知されたときにエ ントリ61に保持している各命令の分岐レベル64を-1することで、各命令の 最新の投機状態を管理している。従って、分岐ユニット2から分岐予測失敗信号 を受けたとき、分岐レベル1以上の命令が現時点における投機命令となり、それ らの投機命令をキャンセルすると共に、それらを保持していたエントリ61のV ビット62を"0"にして再利用を可能にする。

[0024]

#### 【実施例】

次に本発明の実施例について図面を参照して詳細に説明する。

[0025]

図2は本発明を適用したプロセッサの実施例のブロック図である。この例のプロセッサは、命令キャッシュ100、デコード部101、ロード/ストア制御部102、分岐制御部103、リオーダバッファ(ROB)104、リザベーションステーション(RS)105-1、105-2、キャッシュ制御部106、データキャッシュ107、バイパス制御部108、演算器109、リクエスト/リプライ制御部110、リネーミングレジスタ(RR)111、スカラレジスタ(SR)112、命令アドレスカウンタ113、分岐予測部114及び管理部115を主要部として備え、命令パイプラインによる命令の並列実行、特にout-of-order実行を行う。

## [0026]

図1との関係においては、命令アドレスカウンタ113、命令キャッシュ100、デコード部101及び分岐予測部114が図1の命令フェッチ/デコードユニット1に相当し、リザベーションステーション105-1、105-2が図1のリザベーションステーション8に相当し、ロード/ストア制御部102、キャッシュ制御部106、データキャッシュ107、リクエスト/リプライ制御部10及び管理部115が図1のストアユニット4及びロードユニット5に相当し、分岐制御部103が図1の分岐ユニット2に相当し、リオーダバッファ104が図1のリオーダバッファ6を持つ確定ユニット7に相当し、バイパス制御部108及び演算器109が図1の演算ユニット3に相当する。また、図1には示されていないリネーミングレジスタ111及びストアレジスタ112が図2には図示されている。

#### [0027]

リネーミングレジスタ111は、リオーダバッファ104のエントリと1対1に対応するレジスタを含んでおり、リオーダバッファ104のWRB番号iのエントリに格納された演算命令やロード命令等の結果は、リネーミングレジスタ11中のWRB番号iに対応するレジスタに格納されるようになっている。その後、リオーダバッファ104のWRB番号iのエントリに格納された命令が確定した場合、同エントリに格納されているスカラレジスタ番号がパス133に出力され、リネーミングレジスタ111中のWRB番号iに対応するレジスタがパス

134を通じてスカラレジスタ112中の前記スカラレジスタ番号で指定されたレジスタに書き込まれる。

[0028]

以下、本実施例の詳しい構成と動作を説明する。

[0029]

命令アドレスカウンタ113で指定される命令アドレスは、パス137を通じて命令キャッシュ100及び分岐予測部114に与えられる。分岐予測部114は、命令アドレスカウンタ113で指定される命令アドレスを受け、当該命令アドレスが示す分岐命令の分岐履歴が登録されているかどうかを判断し、登録されている場合には、登録されている過去の分岐履歴に基づいて分岐の成立/不成立を予測し、分岐成立と予測した場合には分岐先アドレスをパス138を通じて命令アドレスカウンタ113に送って命令アドレスカウンタ113を更新する。分岐不成立の場合及び分岐命令以外の場合、命令アドレスカウンタ113のカウンタ値が1命令分ずつ加算される。

[0030]

デコード部101は、パス120を通じて命令キャッシュ100からフェッチされた命令のデコードを行い、リオーダバッファ104に蓄積された先行命令を考慮してリネーミングレジスタ111の割り当てを工夫してレジスタ番号に起因するハザードを減らす等の処理を行い、デコードした命令の情報等をプログラムの命令順にリオーダバッファ104に登録すると共に、演算命令の場合には演算系のリザベーションステーション105-1に登録し、ロード/ストア系及び分岐命令の場合にはリザベーションステーション105-2に登録する。

[0031]

図3にリオーダバッファ104のエントリの構成例を示す。各エントリ104 1には、そのエントリを一意に識別するWRB番号1042が物理的に付与され ている。各エントリ1041には、当該エントリが使用中か未使用かを示すVビ ット1043、命令のオペコード1044、当該命令の結果を格納するスカラレ ジスタの番号(SR番号)1045、制御情報1046、分岐レベル1047及 び当該命令が終了したか否かを示すDONEビット1048が格納される。リザ ベーションステーション150-1、150-2のエントリの内容もほぼリオー ダバッファ104のエントリと同様になっている。

[0032]

分岐レベル1047は、デコード部101において図4(A)に示すような方法で生成される。デコード部101には、分岐レベルカウンタ1011があり、その初期値は0になっている。この状態で順次に命令のデコードを行い、各命令に分岐レベルカウンタ1011の現在のカウント値0を分岐レベル0として付与する。分岐命令を1つデコードすると、分岐レベルカウンタ1011を+1し、その分岐命令の後続命令には分岐レベル1を付与する。更に別の分岐命令を1つデコードすると、分岐レベルカウンタ1011を再び+1する。他方、デコードした分岐命令が分岐制御部103において実行され、その分岐命令にかかる分岐予測成功/失敗信号がパス123に出力されると、デコード部101は分岐予測成功であった場合には分岐レベルカウンタ1011を-1し、分岐予測失敗であった場合には0にクリアする。

[0033]

例えば図4 (B)に示すようなロード命令1から分岐命令3までの複数の命令が命令キャッシュ100からフェッチされた場合、デコード部101は各命令に対して同図に示すような分岐レベルを付与して、パス121を通じてリオーダバッファ104へ登録する。また、これらの命令のうち、演算命令はリザベーションステーション105-1にも登録され、ロード命令、ストア命令及び分岐命令はリザベーションステーション150-2にも登録される。リオーダバッファ104及びリザベーションステーション150-1、150-2では、分岐制御部103からパス123に分岐予測成功/失敗信号が出力されると、分岐予測成功時には分岐レベル1以上の分岐レベルを持つエントリの分岐レベルを全て-1し、分岐予測失敗時は分岐レベル1以上の分岐レベルを持つエントリの命令を全てキャンセルする。

[0034]

図3の制御情報1046は、主にオペランドに関する情報であり、先行する命令と依存関係のある命令の場合、制御情報1046中に先行命令が格納されたリ

オーダバッファ104のエントリのWRB番号が入る。例えば、リオーダバッファ104のWRB番号=10のエントリに格納された命令の実行結果をソースとする後続命令の場合、制御情報1046にはWRB番号=10が入る。制御情報1046中に記述されたWRB番号のエントリに格納された命令の実行結果が全て利用可能になると、当該エントリの命令のオペランドの準備が整ったことになり、該当する機能ユニットの資源に空きがあれば、リザベーションステーション150-1、150-2から命令が発行される。

[0035]

以下、ロード/ストア系、演算系、分岐系にわけて構成と動作を説明する。

[0036]

## 〇ロード/ストア系

ロード/ストア制御部102は、ロード命令及びストア命令をリザベーションステーション105-2からパス140を通じて受けると、それをパス122を通じてキャッシュ制御部106及びデータキャッシュ107に伝達し、また管理部115に送り込む。

[0037]

管理部115は、発行されたロード命令及びストア命令をその命令の処理が済むまで保持するエントリを複数備えており、ロード/ストア制御部102からパス122を通じて送られてきたロード命令及びストア命令を空きのエントリに登録して管理する。図5に管理部115に設けられるエントリ1151の構成例を示す。タグ1152は、当該エントリに登録されたロード命令またはストア命令を主記憶に送出する際に付ける識別子であり、事前に設定されている。主記憶からのリプライ時には同じタグが返されるので、どの命令のリプライであるかを区別するために使用される。Vビット1153は、当該エントリが使用中か未使用かを示すビットで、使用した際に"1"に点灯し、未使用にする際に"0"に消灯する。オペコード1154、分岐レベル1155及びWRB番号1156は、発行されたロード命令またはストア命令のオペコード、それに付随する分岐レベル及びWRB番号である。リクエスト要求ビット1157は、当該ロード命令及びストア命令の要求を主記憶に出したか否かを管理するビットであり、主記憶へ

のリクエスト送出時点で"1"に点灯する。キャンセルビット1158は、当該ロード命令またはストア命令がキャンセルされた場合に"1"に点灯するビットである。

#### [0038]

ロード命令の場合、データキャッシュ107は、ヒット/ミスの判定を行い、ヒットしたときはキャッシュデータをパス127を通じてバイパス制御部108へ送出し、その旨をパス142を通じて当該ロード命令に付随するWRB番号を指定して管理部115に通知する。管理部115は、同じWRB番号を持つエントリ1151のキャンセルビット1158が"0"であれば、そのWRB番号を指定した終了通知をパス128を通じてリオーダバッファ104及びリザベーションステーション105−1、105−2に送出する。キャンセルビット1158が"1"であれば、このような終了通知の送出は行わない。

## [0039]

データキャッシュ107は、キャッシュミスしたときはパス139を通じてミ ス信号をキャッシュ制御部106に出す。キャッシュ制御部106は、パス12 5を通じてリクエスト/リプライ制御部110にWRB番号を指定してキャッシ ユミスリクエストを送出する。リクエスト/リプライ制御部110は、管理部**1** 15中の指定されたWRB番号を持つエントリ1151のキャンセルビット11 58が"1"でなければ、パス135を通じて図示しない主記憶にタグ1152 を付随させてロードリクエストを送出する。そして、主記憶からパス136を通 じてタグの付随するリプライデータが返ってきたら、パス144を通じて管理部 115中の同じタグの付いたエントリ1151のキャンセルビット1158を参 照し、"1"でなければパス126を通じてデータキャッシュ107に書き込む とともにパス127を通じてバイパス制御部108及びリネーミングレジスタ1 11にデータを送出する。キャンセルビット1158が"0"の場合にはこのよ うな動作は行わない。また、何れの場合も、管理部115に対してタグを指定し てロード命令の終了を通知する。管理部115は、同じタグの付いたエントリ1 151のキャンセルビット1158が"0"であれば、そのエントリのWRB番 号1156を指定した終了通知をパス128を通じてリオーダバッファ104及 びリザベーションステーション105-1、105-2に送出する。しかし、キャンセルビット1158が"1"であれば、このような終了通知の送出は行わない。

#### [0040]

ストア命令の場合、キャッシュ制御部106はデータキャッシュ107のヒット/ミスにかかわらず、リクエスト/リプライ制御部110にパス125を通じてWRB番号を指定してストアリクエストを送出する。リクエスト/リプライ制御部110は、指定されたWRB番号を持つエントリ1151をパス144を通じて管理部115から参照し、そのタグ1152を付けてパス135を通じて主記憶へストアを要求する。そして、主記憶からのリプライ時、タブを指定してストア命令の完了を管理部115に通知する。管理部115は、同じタグの付いたエントリ1151のキャンセルビット1158が"0"であれば、そのエントリのWRB番号1156を指定した終了通知をパス128を通じてリオーダバッファ104及びリザベーションステーション105−1、105−2に送出する。しかし、キャンセルビット1158が"1"であれば、このような終了通知の送出は行わない。

#### [0041]

#### 〇演算系

バイパス制御部108は、パス124を通じてリザベーションステーション105-1から演算命令が発行されると、パス129を通じてリネーミングレジスタ111から送られるデータ、パス130を通じてスカラレジスタ112から送られるデータ、パス127を通じてデータキャッシュ107から送られるデータを用いて、リザベーションステーション105-1から発行された演算命令をパス131を通じて演算器109に送り、演算させる。演算器109によって得られた演算結果は、パス132を通じてリネーミングレジスタ111中の当該演算命令に付随するWRB番号に対応するレジスタ登録される。

#### [0042]

演算系のリザベーションステーション105-1は、演算命令の発行後、何サイクルで命令が終了するかを自ら管理しており、命令が終了する毎にパス145

を通じてWRB番号を指定してリオーダバッファ104及びリザベーションステーション105-2に終了通知を送る。

[0043]

#### 〇分岐系

分岐制御部103は、パス141を通じてリザベーションステーション105 - 2から分岐命令を受けると、当該分岐命令の分岐判定を行い、WRB番号を付随させた分岐予測成功/失敗信号をパス123を通じて分岐予測部114、デコード部101、リオーダバッファ104、リザベーションステーション105-1、105-2及び管理部115へ送出する。分岐予測部114は、この分岐予測成功/失敗信号に基づいて分岐履歴を更新する。リオーダバッファ104、リザベーションステーション105-1、105-2は、分岐予測成功の場合、自身のエントリに保持する各命令の分岐レベルを-1し、分岐予測失敗の場合、分岐レベルが1以上の命令をすべてキャンセルする。管理部115は、分岐予測成功の場合、自身のエントリ1151に保持する命令の分岐レベル1155を-1し、分岐予測失敗の場合、分岐レベルが1以上の命令を保持するエントリ1151のキャンセルビット1158を"0"にして当該エントリをキャンセル状態とする。

[0044]

図6に図4(B)に示した命令列のストア命令1までが実行終了している時点のリオーダバッファ104の概要を示す。この後、分岐命令1が実行されて、分岐制御部103で分岐判定されている間に後続命令の演算命令2、演算命令3、ロード命令3、ロード命令4、演算命令4等が投機的に実行される。そして、分岐命令1の分岐予測失敗が確定すると、分岐レベルが1以上の命令の全てがキャンセルされ、それらで使われていたエントリの全てが分岐命令1で決定された分岐方向の後続命令によって再利用される。因みに、従来においては、ロード命令3、ロード命令4等のエントリは、そのエントリのWRB番号を指定した終了通知が来るまで使用できない。

[0045]

【発明の効果】

以上説明したように本発明によれば、分岐予測が失敗した分岐命令の後続命令を格納してあるリオーダバッファのエントリを該エントリのWRB番号による終了通知を待たずに新たな命令の格納に再利用することができるため、リオーダバッファのエントリの有効利用が可能となり、ひいてはout-of-order実行できる命令列の範囲を拡大することが可能となる。

## 【図面の簡単な説明】

【図1】

本発明を適用したプロセッサの概略構成を示すブロック図である。

【図2】

本発明を適用したプロセッサの実施例のブロック図である。

【図3】

リオーダバッファのエントリの構成例を示す図である。

【図4】

デコード部における分岐レベルの生成方法の説明図である。

【図5】

ロード系の管理部に設けられるエントリの構成例を示す図である。

【図6】

リオーダバッファの或る時点の内容例を示す図である。

【符号の説明】

- 1…命令フェッチ/デコードユニット
- 2…分岐ユニット
- 3…演算ユニット
- 4 … ストアユニット
- 5…ロードユニット
- 6…リオーダバッファ
- 7…確定ユニット
- 8 … リザベーションステーション
- 5 1 …管理部

【書類名】 図面

【図1】



# 【図2】



【図3】





# 【図4】



| 命令     | 分岐レベル |
|--------|-------|
| ロード命令1 | 0     |
| ロード命令2 | 0     |
| 演算命令1  | 0     |
| ストア命令1 | 0     |
| 分岐命令1  | 0     |
| 演算命令2  | 1     |
| 演算命令3  | 1     |
| ロード命令3 | 1     |
| ロード命令4 | 1     |
| 演算命令4  | 1     |
| 分岐命令2  | 1     |
| ロード命令5 | 2     |
| ロード命令6 | 2     |
| 演算命令5  | 2     |
| 分岐命令3  | 2     |

(B)

【図5】





【図6】

| WRB番号 | Vbit | OPEコード              | 分岐レベル |        | DONE |
|-------|------|---------------------|-------|--------|------|
| 0 0   | 0    | ロード命令 1             | 0     |        | 1    |
| 0 1   | 0    | ロード命令 2             | 0     |        | 1    |
| 0 2   | 0    | 演算命令1               | 0     |        | 1    |
| 0 3   | 0    | ストア命令1              | 0     |        | 1    |
| 0 4   | 1    | 分岐命令 1              | 0     | •. • • | 0    |
| 0 5   | 1    | 演算命令 2              | 1     | • ••   | 0    |
| 0 6   | 1    | 演算命令3               | 1     |        | 0    |
| 0 7   | 1    | ロード命令 3             | 1     | • • •  | 0    |
| 0 8   | 1    | ロード命令 4             | 1     |        | 0    |
| 0 9   | 1    | 演算命令 4              | 1     |        | 0    |
| 0 B   | 1    | 分岐命令 2              | 1     |        | 0    |
| 0 C   | 1 .  | ロード命令 5             | 2     |        | 0    |
| 0 D   | 1    | ロード命令 6             | 2     |        | 0    |
| 0 E   | 1    | 演算命令 5              | 2     |        | 0    |
| 10    | 1    | 分岐命令3               | 2     |        | 0    |
| 1 1   | 0    |                     | 0     | • • •  | 1    |
| 1 2   | .0   |                     | 0     | • • •  | 1    |
| 1 3   | 0    |                     | 0     | • • •  | 1    |
| 14    | 0    |                     | 0     | • • •  | 1    |
| 1 5   | О    | —— <del>-</del> ——— | 0     | • • •  | 1    |
| 16    | 0    |                     | 0     | • • •  | 1    |

【書類名】

要約書

【要約】

【課題】 リオーダバッファ等を使用してout-of-order実行を行う プロセッサにおいて、リオーダバッファを効率良く使用する。

【解決手段】 演算ユニット3、ストアユニット4、ロードユニット5等の各機能ユニットは、リオーダバッファ6のエントリ番号(WRB番号)を用いて、当該エントリに格納された命令の自ユニットにおける処理の終了をリオーダバッファ6に通知する。但し、ロードユニット5は、発行されたロード命令の最新の投機状態を分岐ユニット2から出力される分岐予測成功/失敗信号に基づいて管理し、分岐予測が失敗した分岐命令の後続のロード命令についてはその処理が終了してもWRB番号によるリオーダバッファ6への通知は行わない。これにより、リオーダバッファ6は、分岐予測が失敗した分岐命令の後続のロード命令を格納してあるエントリを即再利用することができる。

【選択図】 図1

## 出願人履歴情報

識別番号

[000004237]

1. 変更年月日

1990年 8月29日

[変更理由]

新規登録

住 所

東京都港区芝五丁目7番1号

氏 名

日本電気株式会社